English

手写语音输入天地

2000-09-20 来源:中华读书报 □江南南 我有话说

 手写输入和语音输入一直是人们所追求的梦想,它更加自然地符合人们的输入习惯。试想,如果计算机能听能看,这样就不再需要通过键盘,不再需要死记硬背一些规则,可以简单地通过手写或口述就可以把需要的东西输入到计算机,对于广大用户来说是一件多么令人神往的事。

1996年以后,中文输入的市场键盘输入一统天下的局面被打破,笔输入、语音输入技术逐渐成熟,摩托罗拉慧笔、汉王笔开始进入人们的视线,以IBM ViaVoice为代表的语音输入也渐渐开始进入实用阶段,人们开始尝试着用笔、用嘴来实现汉字输入,但在具体应用中,键盘输入依然是主流。

手写输入也曾让人们激动了一番。但是,手写输入速度慢、识别率低的问题还是一直没有得到解决,这其中问题的关键就是在于把眼光局限在了单个的汉字上,而没有把上下文的信息充分利用起来,也没能利用汉语中的词组等信息。中文之星采用CLM(中文语言模型)技术的手写输入系统和语音输入系统正在开发之中,由于智能技术的引入,使得手写输入从简单的单字识别,进化到了联系上下文关系并收集笔划信息的智能手写输入阶段。

这对于普通使用者而言,意味着用不着写完每一个汉字再进行识别,只需三笔两笔就能依据上下文关系自动识别,从而可以把手写输入平均每个汉字十一、二笔,压缩到二、三笔,这样就可以大大提高手写输入的速度和准确率。

利用计算机进行语音识别是一种理想的信息处理方式,特别是在计算机控制和信息输入方面有着其独到的优势,其技术经历了长达二十多年的研究之后,已经开始一步步地向实用化靠近。最早的语音识别技术是让计算机能够识别出各种音节,后来逐步加强功能,使计算机能够听懂单独的词,但其间的最大的技术障碍是计算机只能够识别出特定人的声音信息,并且是非连续性的语音信息,这离真正的实用性相差甚远。

这两个技术难题在近几年已被突破,连续语音识别使得讲话人可以更自然、更流畅地表达自己的意图,人与机器之间的交流大大简化,输入速度也大大提高,机器自动对连续的语音流进行分割、识别,其输入速度可以达到150字/分的实用水平。

然而,进行中文语音识别时,还有一个难题是同音字太多,识别的准确率一直是困扰语音输入向前发展的障碍,中文之星公司采用CLM技术开发的语音输入系统,会自动根据上下文的信息对同音字进行选择,对整句输入结果进行智能排错,这不仅可以大大提高语音识别的准确性,而且实用性上也可以向前迈进一大步。

此外,采用模糊处理的方法,还可以解决不同地域口音的问题,即使有口音也不影响识别,也就是说上海普通话、四川普通话、广东普通话、东北普通话都可以自动适应。使用语音识别系统可以让用户得到电脑应用的切实益处,特别适合那些作家、文字工作者和领导干部,解决一些电脑使用者语言能力强、电脑输入能力差的矛盾,可以快速方便地输入各种文件、文稿,极大地方便电脑的使用,提高电脑的使用效率。

在电脑的控制方面,人们所熟悉的控制方式也得到了加强,如在日常生活中经常使用的红外线遥控技术已开始在电脑中使用等等,利用语音识别技术,同样可以很方便地实现电脑的语音控制。这样,电脑的各种操作命令不仅用键盘、鼠标、遥控器、遥控鼠标来实现,也可以用语音的方式来加以控制。

汉字输入走过了十几年的发展历程,如今已经开始演化为键盘、手写、语音三大阵营,尽管不同的人所使用的输入方式不同,但易学易用、快速高效是消费者对各种输入技术的最直接的要求。

拼音输入技术走过了单字、词汇的发展历程,开始向整句智能输入方向发展;手写输入在解决了单字识别率、手写体识别后,人们开始要求速度和简化操作过程;语音识别输入方面在力图打破地域限制的同时,对输入准确性和使用方便性的要求也越来越高。中文之星的CLM技术作为一种核心技术,在提高中文输入效率,降低使用难度等方面有着独到的优势,新一代的智能化输入软件将不断推出。

可以预计,由于智能技术带来的诸多便利,越来越多的电脑使用者将采用智能输入技术,这不仅可以大大提高电脑人机界面的友善性,而且还可以大大提高使用效率,智能软件、智能电子产品一步步走进人们的生活,中文输入这个最最基本的电脑应用领域,也会由于智能技术的引入向前迈出一大步。

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有